SMOTE相关论文
针对传统机器学习模型在医疗小样本数据上由于浅层模型结构和复杂数据特征而导致分类表现不佳的问题,本文提出了一种改进模型cgicFo......
为了提高财务风险预警模型的有效性,解决样本数据不平衡问题、优化预警指标降维程序,文章提出了一种用于财务风险预警的SMOTE-双层XG......
在健康中国大背景下,人们对用药安全的需求日益提升。近几年,随着中国对上市后药品安全监测的加强,国家药品监督管理局每年以自发......
本研究基于浙江省统计局“全面覆盖+精准画像”数据库,从人员、家庭、社会环境三个层面构建浙江省居民收入预测指标体系,并结合抽样......
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样......
近年来,冠心病患者人数不断增加,而集成学习具有良好的冠心病风险预测能力,可降低患者就医成本,提高冠心病筛查的效率。本文利用Kaggle......
不平衡数据集在当今社会生活中大量存在,如肺癌病人诊断数据、信用评估数据、网络攻击识别数据等。针对不平衡数据集的分类叫做不......
随着信息时代的飞速发展,行人的定位与导航在军事、考古、日常出行等场景中扮演着越来越重要的角色。行人的轨迹估算常用的方法有......
数字货币作为一款新兴的投资产品,由于其良好的技术应用前景和较高的投资回报率,在交易市场受到追捧。与其他投资产品一样,市场迫......
该文针对信用卡欺诈客户数据集极不平衡的特点,设计了SMOTE、Borderline SMOTE、ADASYN、SMOTENC四种采样算法,对数据集进行均衡处理......
针对信用数据中的高维稀疏特征与样本不平衡问题易导致模型分类性能欠佳,提出一种新颖的框架来构建信用评分模型.首先,通过计算特......
心血管疾病Cardio-Vascular Disease(CVD)是全世界主要的死亡原因之一,预计到2025年将有2360万人受到CVD的攻击。因此,医疗保健行业......
近年来,随着社会经济快速发展,互联网使商品数据呈指数爆发式增长,推荐系统能够帮助人们从海量商品信息中找到相关或喜好的商品,且......
语音是人机交互过程最自然,最符合用户需求的交互方式。亚马逊echo和谷歌home智能音箱可以通过语音控制家电。嵌入问答系统的电热......
随着我国房价的逐年攀升以及购房压力日益加剧,国家对住房租赁市场愈发重视。十九大报告提出,要加快发展和培育住房租赁市场,构建......
不平衡数据分析是智能制造的关键技术之一,其分类问题已成为机器学习和数据挖掘的研究热点。针对目前不平衡数据过采样策略中人工合......
随着电子商务和互联网科技的飞速发展,很多实体行业正在逐渐地开拓线上市场,其中网上拍卖迅速在我国兴起,它不仅彻底改变了现代人......
雷达辐射源信号识别是电子战的关键部分,很大程度上影响了战争的结果。随着电磁技术的不断进步,新体制雷达的不断研制,战场电磁环......
软件度量数据库的复杂性使得缺陷数据集和无缺陷数据集模块难以区分,而从数据模型的发展过程来看,软件度量数据集对于度量数据的预......
随着工业互联网的发展,带来终端传感设备数量激增,传输与存储的数据呈现爆炸式增长,企业、机构通过数据挖掘能够进行一系列的分析......
为了提高磁瓦表面缺陷在线检测准确率并降低检测时间,提出一种基于机器视觉的检测方法。离线训练时,对经过Gabor小波处理后的子图......
将机器视觉技术引入到了茶小绿叶蝉的自动识别领域,以实现茶园中茶小绿叶蝉的准确及时预报。采集了自然场景下黄色诱虫板的图像,利......
为解决实战运用中已有机器学习算法对侦察低截获雷达型号的识别问题,提出基于样本扩展与生成技术的识别框架。研究基于K-means和组......
列控车载设备故障复杂且车载记录数据为海量非结构化文本,针对车载记录数据特点,提出基于卷积神经网络的车载设备故障智能分类模型......
伴随着现今这种数据大爆炸的时代趋势,图像数据作为这些数据中非常重要的数据应用在各个领域中。越来越多的学者们将研究方向放在......
摘 要: 在网络入侵检测中,异常样本通常要比正常样本少得多,数据的不平衡问题会导致检测模型的分类结果倾向于多数类,影响模型准确率。......
随着数据生成与收集技术的快速发展,如今每天在各行各业的服务器中都会新增海量的数据,这就迫使我们不得不大跨步地迈入“大数据”......
随着计算机存储与数据采集技术的高速发展,基因组学、财务预警、文本分类、客户流失预测和垃圾邮件识别等应用领域产生的海量数据......
针对入侵检测系统对于未知攻击训练较少,导致特定攻击检测率低的问题,提出一种融合最大相异系数密度的SMOTE入侵检测方法。利用改......
长链非编码RNA是指一类长度大于200个核苷酸单位、不编码蛋白质的RNA。之前人们普遍认为编码蛋白质的基因才是主角,但是越来越多的......
粮食损失浪费与我国节粮减损的重大战略以及国家粮食流通环节的产业绩效息息相关,减少损失浪费一直是我国粮食流通行业的关键任务......
蒙古文古籍是研究蒙古族历史文化的重要资源,为了加强对蒙古文古籍的保护,提升蒙古文古籍在研究中的利用率,越来越多的蒙古文古籍......
不平衡数据集中不同类别的样本之间分布不平衡,且数目相差较大,其广泛存在于网络入侵检测、癌症检测、垃圾邮件分类等各个场景中。......
不平衡数据广泛存在于现实生活中。在这样的数据集中,数量上相对稀少的少数类本数据往往是人们所特别关注的重点。在不平衡数据中,......
航行通告机器识别,对于规范化的代码处理相对简单,但对于自然语言处理起来相对困难.针对航行通告中类别多,数据分布不平衡,中英文......
为尽量避免车辆碰撞事故的发生,探索了机器学习和深度学习结合的方法,利用影响车辆碰撞的多个特征变量对车辆碰撞进行检测.首先使......
大规模的人类工程活动诱发和加剧了滑坡灾害的致灾情况,严重威胁工程安全和环境安全。滑坡易发性评价是滑坡监测预警的关键技术。......
针对不平衡数据集在分类过程中易产生噪声数据和分类精度低的问题,提出一种基于改进SMOTE的不平衡数据集主动学习SVM分类算法.该算......
针对在本机构的历史缺陷数据缺乏的情况下,如何合理利用跨机构的缺陷数据进行预测的问题,提出一种基于迁移的跨机构软件缺陷集成采......
逆变器作为一种电力变换的装置,具有性能优越、使用方便等优点,在生产中不可或缺。具有大功率的三电平逆变器核心元器件发生故障时......
多种慢性疾病若不能得到有效诊断和治疗会引发综合征,因此疾病的早期识别和诊断在临床实践中发挥着重要作用。目前提出的模型都假......
针对不平衡数据分类问题,提出了基于Smote与核函数修改相结合的算法。首先用Smote方法处理数据,降低不平衡度;然后以黎曼几何为依......
针对不平衡数据分类问题,提出了基于Smote与核函数修改相结合的算法。首先用Smote方法处理数据,降低不平衡度;然后以黎曼几何为依......
基于分形自相似性理论改进SMOTE算法,实现数据集的均衡化。结合集成学习Adaboost技术更新样本权值,改善非均衡数据的分类性能,并对......
针对信用评价中最为常见的不平衡小样本数据集问题,以及不同误分类造成的损失代价不同问题,在传统SVM模型基础上,提出采用过采样的SMO......